专利摘要:
一種用以編碼具有一音訊樣本流的一音訊信號的裝置,其包含:一視窗程式,其用以對該音訊樣本流應用一預測編碼分析視窗以獲得供預測分析用之視窗化資料,且用以對該音訊樣本流應用一轉換編碼分析視窗以獲得供轉換分析用之視窗化資料,其中該轉換編碼分析視窗與一當前音訊樣本訊框內之音訊樣本及一未來音訊樣本訊框作為一轉換編碼超前部分的一預定義部分之音訊樣本相關聯,其中該預測編碼分析視窗與當前訊框之音訊樣本的至少一部分及一未來訊框作為一預測編碼超前部分之預定義部分的音訊樣本相關聯,其中該轉換編碼超前部分及該預測編碼超前部分彼此是完全相同的或不同之處在於小於20%的預測編碼超前部分或小於20%的轉換編碼超前部分;及一編碼處理器,其用以使用供預測分析之視窗化資料來產生當前訊框之預測編碼資料、或用以使用供轉換分析用之視窗化資料來產生當前訊框之轉換編碼資料。
公开号:TW201301262A
申请号:TW101104674
申请日:2012-02-14
公开日:2013-01-01
发明作者:Emmanuel Ravelli;Ralf Geiger;Markus Schnell;Guillaume Fuchs;Vesa Ruoppila;Tom Backstrom;Bernhard Grill;Christian Helmrich
申请人:Fraunhofer Ges Forschung;
IPC主号:G10L19-00
专利说明:
用以使用對齊的預看部分將音訊信號編碼及解碼的裝置與方法
本發明有關於音訊編碼,且特別是有關於依賴於切換音訊編碼器及相應控制音訊解碼器,尤其適用於低延遲應用的音訊編碼。
依賴於切換編解碼器的若干音訊編碼構想是習知的。一眾所周知的音訊編碼構想是所謂的延伸型寬頻調適性多位元率(AMR-WB+)編解碼器,如3GPP TS 26.290 B10.0.0(2011-03)中所記載者。AMR-WB+音訊編解碼器包含所有AMR-WB語音編解碼器模式1至9及AMR-WB VAD以及DTX。AMR-WB+藉由增加TCX、頻寬擴展及立體聲來擴充AMR-WB編解碼器。
AMR-WB+音訊編解碼器以一內部取樣頻率FS處理等同於2048個樣本的輸入訊框。內部取樣頻率被局限於12800到38400Hz的範圍。2048個樣本訊框被分裂成兩個臨界取樣的等頻帶。這導致對應於低頻(LF)及高頻(HF)帶的兩個1024樣本的超級訊框。每一超級訊框被劃分成四個256-樣本訊框。藉由使用重新取樣輸入信號的一可變取樣轉換方案而獲得內部取樣率之取樣。
LF及HF信號接著使用兩種不同的方法而被編碼:LF使用「核心」編碼器/解碼器基於切換ACELP及變換編碼激勵(TCX)而被編碼及解碼。在ACELP模式中,標準的AMR-WB編解碼器被使用。HF信號是使用一頻寬擴展(BWE)方法以相對較少位元(16位元/訊框)而被編碼的。自編碼器傳送至解碼器之參數是模式選擇位元、LF參數及HF參數。每一1024樣本超級音框的參數被分解成相同大小的四個封包。當輸入信號為立體聲時,左及右通道被組合成一單聲道信號以供ACELP/TXC編碼,而立體聲編碼接收此二輸入通道。在解碼器端,LF及HF帶被單獨解碼,在此之後,它們在一合成濾波器組中被組合。若輸出僅限於單聲道,則立體聲參數被忽略且解碼器以單聲道模式運作。當編碼LF信號時,AMR-WB+編解碼器對ACELP及TCX模式應用LP分析。LP係數被線性地內插於每一64-樣本子訊框。LP分析視窗是長度384樣本之半餘弦。為了編碼核心單聲道信號,一ACELP或TCX編碼被用於每一訊框。編碼模式是基於一閉迴路合成分析法而選擇的。僅256-樣本訊框被考慮使用ACELP訊框,而256、512或1024樣本訊框可能是TCX模式的。AMR-WB+中的LPC分析所使用的視窗被繪示於第5b圖中。具有20ms超前的一對稱LPC分析視窗被使用。超前意指,如第5b圖中所示者,以500繪示的當前訊框的LPC分析視窗不僅在第5b圖中以502所繪示之0到20ms之間所指示的當前訊框內延伸,而且延伸到20到40ms之間的未來訊框中。這意味著,藉由使用此LPC分析視窗,一另外的20ms延遲,即一整個未來訊框是必需的。因此,在第5b圖中以504所指示之超前部分促成與AMR-WB+編碼器相關聯之系統延遲。換言之,一未來訊框必須完全可用以使當前訊框502的LPC分析係數可被算出。
第5a圖繪示另一編碼器,所謂的AMR-WB編碼器,且詳言之是用以計算當前訊框之分析係數的LPC分析視窗。當前訊框再一次在0到20ms之間延伸且未來訊框在20到40ms之間延伸。對照於第5b圖,506所指示之AMR-WB之LPC分析視窗具有僅5ms的一超前部分508,即20ms到25ms之間的時間距離。因此,LPC分析所引入之延遲相對於第5a圖大幅減小。然而,另一方面,已發現,用以確定LPC係數的一較大的超前部分,即LPC分析視窗的一較大的超前部分導致較佳的LPC係數,且因此,殘差信號中有一較小的能量,且因此,一較低的位元率,這是因為LPC預測更佳地適合原始信號。
雖然第5a及5b圖有關於僅具有用以確定一訊框之LPC係數的一單一分析視窗的編碼器,第5c圖繪示G.718語音編碼器的情況。G718(06-2008)規格有關於傳輸系統及媒體數位系統及網路,且特別是,描述數位終端設備,且特別是,用於此設備的語音及音訊信號之編碼。特別是,此標準有關於建議書ITU-T G718所定義之8-32kbit/s語音及音訊的強健的窄頻及寬頻嵌入式可變位元率編碼。輸入信號是使用20ms的訊框來處理的。編解碼器延遲視輸入及輸出之取樣率而定。對於一寬頻輸入及寬頻輸出,此編碼之總演算法延遲是42.875ms。其由一個20-ms訊框、輸入及輸出重新取樣濾波器之1.875ms延遲,供編碼器超前使用之10ms、後濾波延遲之1ms延遲及解碼器之10ms組成,以允許較高層轉換編碼之重疊相加操作。對於一窄頻輸入及一窄頻輸出,較高層並未被使用,但是10ms解碼器延遲被用以改良在存在訊框抹除下及對於音樂信號的編碼性能。若輸出被限於層2,則編解碼器延遲可減少10ms。編碼器的說明如下。下部的二層被應用於在12.8kHz取樣的一預先加強信號,且上面的三層在16kHz取樣的輸入信號域中運作。核心層是基於碼激勵線性預測(CELP)技術,其中語音信號藉由穿過代表頻譜包絡的一線性預測(LP)合成濾波器的一激勵信號而被模型化。LP濾波器使用一切換預測方法及多階向量量子化在導抗頻譜率(ISF)域中被量子化。開迴路音高分析藉由一音高追蹤演算法來執行,以確保一平滑的音高輪廓。兩個共存的音高演進輪廓被比較且產生較平滑輪廓的軌道被選擇,以使音高估計更強健。訊框層級預處理包含一高通濾波,一每秒12800個樣本的取樣轉換,一預先加強,一頻譜分析,一窄頻輸入之檢測,一語音活動檢測,一雜訊估計,雜訊降低,線性預測分析,一LP至ISF轉換,及一內插,一加權語音信號之計算,一開迴路音高分析,一背景雜訊更新,對於一編碼模式選擇及訊框抹除隱藏的一信號分類。使用選擇之編碼類型的層1編碼包含一清音編碼模式、一濁音編碼模式、一變換編碼模式、一通用編碼模式,及一不連續傳輸及舒適雜訊生成(DTX/CNG)。
使用自相關法的一長期預測或線性預測(LP)分析決定CELP模型之合成濾波器之係數。然而,在CELP中,長期預測通常是「適應性碼簿」,故不同於線性預測。因此,線性預測可被視為一短期預測。視窗化語音之自相關使用列文遜-杜賓(Levinson-Durbin)演算法被轉換成LP係數。接著,LPC係數被轉換成導抗譜對(ISP),且因而為了量子化及內插目的轉換成導抗頻譜率(ISF)。內插之量子化及非量子化係數被轉換回LP域以構建對於每一子訊框的合成及加權濾波器。若編碼一主動信號訊框,使用在第5c圖中以510及512所指示的兩個LPC分析視窗,兩組LP係數在每一訊框中被估計。視窗512被稱作「中訊框LPC視窗」,且視窗510被稱作「結束訊框LPC視窗」。10ms的一超前部分514被用於訊框末端自相關計算。訊框結構被繪示於第5c圖中。訊框被劃分為四個子訊框,每一子訊框具有對應於取樣率12.8kHz之64個樣本的5ms長度。用於訊框末端分析及用於中訊框分析的視窗分別以第四子訊框及第二子訊框為中心,如第5c圖中所示者。長度為320個樣本的一漢明視窗用於視窗化。該等係數在G.718,6.4.1節中被定義。自相關計算被記載於6.4.2節中。列文遜-杜賓演算法被記載於第6.4.3節中,LP至ISP轉換被記載於6.4.4節中,且ISP至LP轉換被記載於6.4.5節中。
語音編碼參數,諸如適應性碼簿延遲及增益,代數碼簿索引及增益藉由最小化感知加權域中的輸入信號與合成信號之間之誤差而被搜尋。感知加權是藉由透過由LP濾波器係數所導出的一感知加權濾波器來對信號濾波而執行。感知加權信號也用在開迴路音高分析中。
G.718編碼器是僅具有單一語音編碼模式的一純語音編碼器。因此,G.718編碼器並非一切換編碼器,且因此,此一編碼器之缺點在於其僅在核心層內提供一單一的語音編碼模式。因此,當此一編碼器被應用於語音信號以外的其他信號,即應用於CELP編碼的模型並不適當之一般音訊信號時,品質問題將出現。
另外的一切換編解碼器是所謂的USAC編解碼器,即定義於日期2010年9月24日的ISO/IEC CD 23003-3中的統一語音及音訊編解碼器。此切換編解碼器所用之LPC分析視窗在第5d圖中以516來指示。再一次假定一當前訊框在0到20ms之間延伸,且因此,此編解碼器之超前部分618似乎為20ms,即明顯高於G.718之超前部分。因此,雖然USAC編碼器由於其切換性質而提供一良好的音訊品質,但是因為第5d圖中的LPC分析視窗超前部分518,延遲是相當大的。USAC之一般結構如下。首先,有一共同預/後處理,為一處理立體聲或多通道處理的一MPEG環繞聲(MPEGS)功能單元及一處理輸入信號中的較高音訊頻率之參數表示的一增強SBR(eSBR)單元所組成。接著,有兩個分支,一個分支由一修改的進階音訊編碼(AAC)工具路徑組成且另一分支由一以線性預測編碼(LP或LPC域)為基礎的路徑組成,以線性預測編碼(LP或LPC域)為基礎的路徑復具有LPC殘差之一頻域表示或一時域表示的特徵。用於AAC及LPC的所有透射譜在量子化及算術編碼之後被表示在MDCT域中。時域表示使用一ACELP激勵編碼方案。ACELP工具藉由組合一長期預測器(適應性碼字)與一脈衝型序列(創新碼字)提供一種有效地表示一時域激勵信號的方式。重建之激勵透過一LP合成濾波器來發送以形成一時域信號。ACELP工具的輸入包含適應性及創新碼簿索引,適應性及創新碼增益值,其他控制資料及反量子化及內插LPC濾波器係數。ACELP工具之輸出是時域重建音訊信號。
MDCT基TCX解碼工具被使用來將加權LP殘差表示自一MDCT域變回一時域信號並輸出包括加權LP合成濾波的加權時域信號。IMDCT可被配置成支持256、512或1024個頻譜係數。TCX工具的輸入包含(反量子化)MDCT譜,及反量子化及內插LPC濾波器係數。TCX工具之輸出是時域重建音訊信號。
第6圖繪示USAC中的一情況,其中用於當前訊框的LPC分析視窗516及用於過去或最後訊框的LPC分析視窗520被繪示,且除此之外,一TCX視窗522被繪示。TCX視窗522以在0到20ms之間延伸的當前訊框之中心為中心,且10ms延伸到過去訊框中以及10ms延伸到在20到40ms之間延伸的未來訊框中。因此,LPC分析視窗516要求一LPC超前部分在20到40ms之間,即20ms,而TCX分析視窗另具有在20到30ms之間延伸進入到未來訊框中的一超前部分。這意味著USAC分析視窗516所引入之延遲為20ms,而由TCX視窗引入到編碼器中之延遲為10ms。因此,清楚的是,兩種視窗之超前部分並未彼此對齊。因此,即使TCX視窗522僅引入10ms的延遲,由於LPC分析視窗516,編碼器之整個延遲仍為20ms。因此,即使TCX視窗有一相當小的超前部分,這並未減少編碼器之總演算法延遲,這是因為總延遲由最高貢獻決定,即等於20ms,因為LPC分析視窗516有20ms延伸到未來訊框中,即不僅涵蓋當前訊框而且還涵蓋未來訊框。
本發明之一目的在於提供音訊編碼或解碼的一改良的編碼構想,一方面,提供一良好的音訊品質,且另一方面,導致一縮短之延遲。
此目的是藉由一種如申請專利範圍第1項所述之用以編碼一音訊信號之裝置,如申請專利範圍第15項所述之編碼一音訊信號之方法,如申請專利範圍第16項所述之音訊解碼器,如申請專利範圍第24項所述之音訊解碼方法或如申請專利範圍第25項所述之電腦程式來實現。
依據本發明,具有一轉換編碼分支及一預測編碼分支的一切換音訊編解碼器方案被應用。重要地是,這兩種視窗,即一方面,預測編碼分析視窗,以及另一方面,轉換編碼分析視窗在它們的超前部分是對齊的,使得轉換編碼超前部分及預測編碼超前部分彼此是完全相同的,或彼此不同之處在於小於20%的預測編碼超前部分或小於20%的轉換編碼超前部分。應指出的是,預測分析視窗不僅是用在預測編碼分支中,而實際上是用在二分支中。LPC分析也用於為轉換域中的雜訊整形。因此,換言之,超前部分彼此是完全相同的或彼此相當接近。這確保一最佳折衷被實現且無音訊品質或延遲特徵被設定成一次佳方式。因此,對於分析視窗中的預測編碼,已發現,超前越高,LPC分析越佳,但是,另一方面,延遲隨著一較高的超前部分而增大。另一方面,TCX視窗同樣如此。TCX視窗之超前部分越高,TCX位元率可減少得越多,這是因為一般而言,較長的TCX視窗導致較低的位元率。因此,對照於本發明,超前部分彼此是完全相同的或彼此相當接近,且詳細而言,不同之處小於20%。因此,另一方面,由於延遲原因而不希望有的超前部分最佳地是由編碼/解碼分支二者使用。
鑒於此,本發明一方面提供當二分析視窗之超前部分設定低時具有一低延遲的一改良的編碼概念,且另一方面提供一具有良好特性的編碼/解碼概念,良好特性肇因於因音訊品質原因或位元率原因而必需被引入之延遲最佳地由二編碼分支使用、而非僅由一單一編碼分支使用。
用以編碼具有一音訊樣本流的一音訊信號的一裝置包含一視窗程式,用以對一音訊樣本流應用一預測編碼分析視窗以獲得供預測分析用之視窗化資料,且用以對該音訊樣本流應用一轉換編碼分析視窗以獲得供轉換分析用之視窗化資料。轉換編碼分析視窗與作為一轉換編碼超前部分的一未來音訊樣本訊框之一預定義超前部分之一當前音訊樣本訊框之音訊樣本相關聯。
此外,預測編碼分析視窗與當前訊框之音訊樣本的至少一部分以及作為一預測編碼超前部分的未來訊框之一預定義部分之音訊樣本相關聯。
轉換編碼超前部分及預測編碼超前部分彼此是完全相同的或彼此不同之處在於小於20%的預測編碼超前部分或小於20%的轉換編碼超前部分,且因此彼此相當接近。該裝置另外包含一編碼處理器,用以使用供預測分析用之視窗化資料來產生當前訊框之預測編碼資料、或用以使用供轉換分析用之視窗化資料來產生當前訊框之轉換編碼資料。
用以解碼一編碼音訊信號的一音訊解碼器包含一預測參數解碼器,該預測參數解碼器對一來自編碼音訊信號的一預測編碼訊框的資料執行解碼,且第二分支包含一轉換參數解碼器,該轉換參數解碼器用以執行來自編碼音訊信號的一轉換編碼訊框的資料之解碼。
轉換參數解碼器被配置成用以執行一頻譜-時間轉換,較佳地是一混疊影響轉換,諸如MDCT或MDST或任一其他此類轉換,且用以對轉換資料應用一合成視窗以獲得當前訊框及未來訊框的一資料。由音訊解碼器所應用的合成視窗具有第一重疊部分、一相鄰的第二非重疊部分及一相鄰的第三重疊部分,其中第三重疊部分與用於未來訊框的音訊樣本相關聯且非重疊部分與當前訊框之資料相關聯。此外,為了使解碼器端具有一良好的音訊品質,一重疊相加器被應用,用以將與當前訊框的一合成視窗之第三重疊部分相關聯之合成視窗化樣本及與未來訊框的一合成視窗之第一重疊部分相關聯之合成視窗化樣本重疊並相加,以獲得用於未來訊框的第一部分的音訊樣本,其中當當前訊框及未來訊框包含轉換編碼資料時,未來訊框的其餘音訊樣本是與未重疊相加下所獲得之未來訊框的合成視窗之第二非重疊部分相關聯的合成視窗化樣本。
本發明之較佳實施例具有以下特徵:轉換編碼分支諸如TCX分支與預測編碼分支諸如ACELP分支的同一超前彼此是完全相同的,使得在延遲限制下,此二編碼模式具有最大可用超前。此外,較佳地是,TCX視窗重疊被限於超前部分,使得自一訊框到下一訊框自轉換編碼模式至預測編碼模式的切換是容易的,可能沒有任何混疊處理問題。
將重疊局限於超前的另一原因是為了不在解碼器端引入延遲。若有具有10ms超前及,例如20ms重疊的一TCX視窗,將會在解碼器中多引入10ms的延遲。當有具有10ms超前及10ms重疊的一TCX視窗時,在解碼器端並不會有額外的延遲。其有利的結果是較容易切換。
因此,較佳地是分析視窗之第二非重疊部分,以及當然地合成視窗延伸至當前訊框末端,且第三重疊部分僅起始於未來訊框。此外,TCX或轉換編碼分析/合成視窗之非零部分與訊框之起點對齊,因此再一次可得到從一模式到另一模式的容易且低效率切換。
此外,較佳地是,由複數子訊框,諸如四個子訊框組成的一完整訊框可在轉換編碼模式(諸如TCX模式)中被完全編碼或在預測編碼模式(諸如ACELP模式)中被完全編碼。
此外,較佳地是,不是僅使用一單一LPC分析視窗而是兩種不同的LPC分析視窗,其中一LPC分析視窗與第四子訊框之中心對齊且是一結束訊框分析視窗,而另一分析視窗與第二子訊框之中心對齊且是一中訊框分析視窗。若編碼器被切換成轉換編碼,則較佳地是只發送僅基於結束訊框LPC分析視窗而由LPC分析所導出的一單一LPC係數資料集。此外,在解碼器端,較佳地是不直接對轉換編碼合成使用此一LPC資料,且特別是TCX係數之頻譜加權。代之者,較佳地是,以由過去訊框,即時間恰在當前訊框前之訊框的結束訊框LPC分析視窗所獲得的資料內插由當前訊框之結束訊框LPC分析視窗所獲得的TCX資料。相較於發送兩個LPC係數資料集供中訊框分析及結束訊框分析,藉由在TCX模式中僅發送關於一完整訊框的一單一LPC係數集可獲得進一步的位元率減少。然而,當編碼器被切換成ACELP模式時,兩個LPC係數集均由編碼器發送至解碼器。
此外,較佳地是,中訊框LPC分析視窗恰在當前訊框之較後訊框邊界上結束,此外還延伸到過去訊框中。這並未引入任何延遲,這是因為過去訊框已經可利用且可毋需任何延遲被使用。
另一方面,較佳地是,結束訊框分析視窗從當前訊框內的某處而非當前訊框的起點開始。然而,這是沒有問題的,因為,形成TCX加權使用了過去訊框的結束訊框LPC資料集與當前訊框的結束訊框LPC資料集之一平均,使得從某種意義上來說,最後所有資料都被用以計算LPC係數。因此,結束訊框分析視窗之開始較佳地在過去訊框之結束訊框分析視窗之超前部分內。
在解碼器端,由一模式切換至另一模式獲得一顯著減小的費用。原因在於合成視窗之非重疊部分,較佳地是在其自身內是對稱的,並不與當前訊框之樣本相關聯而是與一未來訊框之樣本相關聯,且因此僅在超前部分內,即僅在未來訊框中延伸。因此,合成視窗是使得僅有較佳地為起始於當前訊框正開始處的第一重疊部分在當前訊框內,且第二非重疊部分自第一重疊部分末端延伸至當前訊框末端,且因此,第二重疊部分與超前部分重合。因此,當有一從TCX到ACELP的轉變時,由於合成視窗之重疊部分所獲得的資料完全被摒除且由獲自於ACELP分支外之未來訊框剛開始的預測編碼資料所取代。
另一方面,當有一從ACELP到TCX的切換時,一特定轉變視窗被應用,該視窗恰起始於當前訊框,即剛轉換後之訊框的起點,具有一非重疊部分,使得任何資料都不必重建以獲得重疊「夥伴」。代之者,合成視窗之非重疊部分提供正確資料,毋需解碼器中所需要的任何重疊及重疊相加程序。僅對於重疊部分,即用於當前訊框的視窗之第三部分及用於下一訊框的視窗之第一部分,一重疊相加程序是有用的且被執行以如同在一直接MDCT中一般得到從一區塊到另一區塊的一連續的淡入/淡出,俾最終獲得一良好的音訊品質,由於在業內亦屬習知、稱作「時域混疊消除(TDAC)」的MDCT臨界取樣性質而無需增加位元率。
此外,解碼器有用之處還在於,對於一ACELP編碼模式,由編碼器中的中訊框視窗及結束訊框視窗所導出之LPC資料被發送,而對於TCX編碼模式,僅由結束訊框視窗所導出的一單一LPC資料集被使用。然而,對於頻譜加權TCX解碼資料,發送之LPC資料並未以其原狀態被使用,而是與對過去訊框所獲得的結束訊框LPC分析視窗的對應資料求平均。 圖式簡單說明
本發明之較佳實施例隨後相關於附圖而被描述,其中:第1a圖繪示一切換音訊編碼器的一方塊圖;第1b圖繪示一對應的切換解碼器的一方塊圖;第1c圖繪示關於第1b圖中所示之轉換參數解碼器的更多細節;第1d圖繪示關於第1a圖之解碼器之轉換編碼模式的更多細節;第2a圖繪示應用在轉換編碼分析之編碼器中之視窗程式的一較佳實施例,該視窗程式一方面供LPC分析用,且另一方面是第1b圖之轉換編碼解碼器中所使用的合成視窗的一表示;第2b圖繪示對於二訊框以上之時距的對齊LPC分析視窗及TCX視窗的一視窗序列;第2c圖繪示自TCX轉變成ACELP的一情況及自ACELP轉變成TCX的一轉變視窗;第3a圖繪示第1a圖之編碼器之更多細節;第3b圖繪示用以決定一訊框的一編碼模式的一合成分析程序;第3c圖繪示用以決定每一訊框之模式的另一實施例;第4a圖繪示藉由利用兩個不同的LPC分析視窗所導出的LPC資料對一當前訊框的計算及使用;第4b圖繪示藉由對編碼器之TCX分支使用一LPC分析視窗而視窗化所獲得之LPC資料之使用;第5a圖繪示用於AMR-WB的LPC分析視窗;第5b圖繪示為了LPC分析用於AMR-WB+的對稱視窗;第5c圖繪示一G.718編碼器的LPC分析視窗;第5d圖繪示USAC中所使用的LPC分析視窗;以及第6圖繪示相對於一當前訊框之一TCX視窗的當前訊框之一LPC分析視窗。
第1a圖繪示用以編碼具有一音訊樣本流的一音訊信號的一裝置。該等音訊樣本或音訊資料自100進入編碼器。音訊資料被引入一視窗程式102,用以對音訊樣本流應用一預測編碼分析視窗以獲得供預測分析用之視窗化資料。視窗程式102另配置成用以對音訊樣本流應用一轉換編碼分析視窗以獲得供轉換分析用之視窗化資料。視實施態樣而定,LPC視窗並未直接應用於原始信號,而是應用於一「預先加強」信號(像在AMR-WB、AMR-WB+、G718及USAC中)。另一方面,TCX視窗被直接應用於原始信號(像在USAC中)。然而,此二視窗也可被應用於相同的信號、或TCX視窗也可被應用於自原始信號導出,諸如藉由用來增強品質或壓縮效率的預先加強或任何其他加權所導出的一處理後音訊信號。
轉換編碼分析視窗與一當前音訊樣本訊框中的音訊樣本相關聯,且與作為一轉換編碼超前部分的未來音訊樣本訊框的一預定義部分之音訊樣本相關聯。
此外,預測編碼分析視窗與當前訊框之音訊樣本的至少一部分相關聯,且與作為一預測編碼超前部分的未來訊框的一預定義部分之音訊樣本相關聯。
如方塊102中概述所者,轉換編碼超前部分及預測編碼超前部分彼此對齊,這意味著這些部分是完全相同的或彼此相當接近,諸如二者不同之處在於小於20%的預測編碼超前部分或小於20%的轉換編碼超前部分。較佳地是,超前部分彼此是完全相同的或彼此不同之處甚至小於5%的預測編碼超前部分或小於5%的轉換編碼超前部分。
編碼器額外包含一編碼處理器104,用以使用供預測分析之視窗化資料來產生用於當前訊框的預測編碼資料、或用以使用供轉換分析之視窗化資料來產生用於當前訊框的轉換編碼資料。
此外,編碼器較佳地包含一輸出介面106,輸出介面106透過線108b來接收一當前訊框,且實際上每一訊框之LPC資料108a及轉換編碼資料(諸如TCX資料)或預測編碼資料(ACELP資料)。編碼處理器104提供這兩種資料並接收110a所指示的供預測分析的視窗化資料及110b所指示的供轉換分析的視窗化資料作為輸入。此外,該編碼裝置還包含一編碼模式選擇器或控制器112,接收音訊資料100作為一輸入,且經由控制線114a向編碼處理器104提供控制資料、或經由控制線114b向輸出介面106提供控制資料作為一輸出。
第3a圖提供關於編碼處理器104及視窗程式102的額外細節。視窗程式102較佳地包含,作為第一模組的LPC或預測編碼分析視窗程式102a及作為第二組件或模組的轉換編碼視窗程式(諸如TCX視窗程式)102b。如箭頭300所指示者,LPC分析視窗與TCX視窗彼此對齊,使得此二視窗之超前部分彼此是完全相同的,這意味著此二超前部分延伸至相同的時刻進入一未來訊框。第3a圖中自LPC視窗程式102a前進到右側的上部分支是包含一LPC分析器及內插器302、一感知加權濾波器或一加權區塊304及一預測編碼參數計算器306,諸如ACELP參數計算器的一預測編碼分支。音訊資料100被提供給LPC視窗程式102a及感知加權區塊304。此外,音訊資料被提供給TCX視窗程式,且自TCX視窗程式之輸出向右的下部分支構成一轉換編碼分支。此轉換編碼分支包含一時間-頻率轉換區塊310、一頻譜加權區塊312及一處理/量子化編碼區塊314。時域轉換區塊310較佳地被實施為一混疊引入轉換,諸如MDCT、MDST或具有大於輸出值數目的輸入值的任一其他轉換。時域轉換使作為一輸入的視窗化資料由TCX,或一般而言,轉換編碼視窗程式102b輸出。
儘管第3a圖指出,對於預測編碼分支,一LPC處理利用一ACELP編碼演算法,業內已知的其他預測編碼器,諸如CELP或任一其他時域編碼器也可被應用,但一方面由於其品質另一方面由於其效率,ACELP演算法是較佳的。
此外,對於轉換編碼分支,一MDCT處理,特別是在時間-頻率轉換區塊310中是較佳的,但是任何其他頻譜域轉換也可被執行。
此外,第3a圖繪示一頻譜加權312,用以將區塊310所輸出之頻譜值轉換到一LPC域。此頻譜加權312在預測編碼分支中使用由區塊302所產生的LPC分析資料導出的加權資料來執行。然而,可選擇地,自時域轉換到LPC域也可在時域中執行。在此情況下,一LPC分析濾波器將被置於TCX視窗程式102b之前以計算預測殘差時域資料。然而,已發現,自時域轉換到LPC域較佳地是在頻譜域中藉由使用在頻譜域,諸如MDCT域中由LPC資料轉換成對應加權因數的LPC分析資料來頻譜加權轉換編碼資料被執行。
第3b圖繪示說明對於每一訊框的編碼模式之一合成分析或「閉迴路」決定的一般概覽。為此,第3c圖中所示之編碼器包含一完整的轉換編碼編碼器及轉換編碼解碼器,如104b所示者,且另外包含一完整的預測編碼編碼器及對應的解碼器,如第3c圖中之104a所指示者。二區塊104a、104b均接收音訊資料作為輸入且執行一完整的編碼/解碼操作。接著,二編碼分支104a、104b的編碼/解碼操作之結果與原始信號比較,且一品質測度被測定,以找出哪一編碼模式導致一較佳品質。品質測度可以是一分段SNR值或一平均分段SNR,諸如,舉例而言,在3GPP TS 26.290之5.2.3節中所記載者。然而,任何其他品質測度也可被應用,這典型地依賴於編碼/解碼結果與原始信號之比較。
基於由每一分支104a、104b提供給決策器112的品質測度,該決策器決定當前檢驗訊框是否將使用ACELP或TCX而被編碼。繼該決策之後,有幾種方式來執行編碼模式選擇。一種方式是決策器112控制對應的編碼器/解碼器區塊104a、104b,以僅向輸出介面106輸出當前訊框的編碼結果,使得確定,對於某一訊框,僅一單一的編碼結果在輸出編碼信號107中被發送。
可選擇地,二裝置104a、104b可將它們的編碼結果轉發至輸出介面106,且此二結果被儲存在輸出介面106中直到決策器經由線105控制輸出介面以自區塊104b或自區塊104a輸出結果為止。
第3b圖繪示第3c圖之構想的更多細節。特別是,區塊104a包含一完整的ACELP編碼器及一完整的ACELP解碼器以及一比較器112a。比較器112a向比較器112c提供一品質測度。比較器112b也是如此,其具有一基於一TCX編碼與再次解碼信號與原始音訊信號之比較的品質測度。隨後,此二比較器112a、112b向最終比較器112c提供它們的品質測度。視哪一品質測度較佳而定,比較器決定一CELP或TCX決策。該決策可藉由將額外因素引入決策而被改進。
可選擇地,用以基於對於當前訊框的音訊信號之信號分析來決定一當前訊框之編碼模式的一開迴路模式可被執行。在此情況下,第3c圖之決策器112將會執行當前訊框的音訊資料之一信號分析,且接著將會控制一ACELP編碼器或一TCX編碼器以實際編碼當前音訊框。在此情況下,編碼器將不需要一完整的解碼器,而是單獨在編碼器內實施編碼步驟即足夠。開迴路信號分類及信號決策,例如也在AMR-WB+(3GPP TS 26.290)中記載。
第2a圖繪示視窗程式102,且特別是視窗程式所供給之視窗的一較佳實施態樣。
較佳地是,當前訊框的預測編碼分析視窗以第四子訊框之中心為中心,且此視窗以200來指示。此外,較佳地是使用另外的一LPC分析視窗,即202所指示且以當前訊框之第二子訊框之中心為中心的中訊框LPC分析視窗。此外,轉換編碼視窗,諸如,舉例而言,MDCT視窗204是相對於兩個LPC分析視窗200、202被安置,如圖所示者。特別是,分析視窗之超前部分206與預測編碼分析視窗之超前部分208在時間長度上是相同的。此二超前部分延伸10ms到未來訊框中。此外,較佳地是,轉換編碼分析視窗不僅具有重疊部分206,而且具有在10與20ms之間的一非重疊部分208及第一重疊部分210。重疊部分206及210是一解碼器中的重疊相加器在重疊部分中執行一重疊相加處理,但是一重疊相加程序對非重疊部分是不需要的。
較佳地是,第一重疊部分210從訊框起點,即0ms開始並延伸至訊框中心,即10ms為止。此外,非重疊部分自訊框210之第一部分末端延伸至20ms處的訊框末端,因此第二重疊部分206與超前部分完全重合。因為從一模式切換成另一模式,這具有優勢。從一TCX性能觀點來看,更佳者為使用具有完全重疊(20ms重疊,如USAC中一般)的一正弦視窗。然而,對於在TCX與ACELP之間轉變,這將需要一技術如正向混疊消除。正向混疊消除在USAC中使用,以消除由缺失的下一TCX訊框所引入之混疊(被ACELP取代)。正向混疊消除需要大量位元,且因此,並不適於一恆定的位元率,且特別是低位元率編解碼器,如所述編解碼器之一較佳實施例。因此,依據本發明之實施例,不使用FAC,TCX視窗重疊減少且視窗向未來移動,使得完全重疊部分206位於未來訊框中。此外,當下一訊框是ACELP時,第2a圖中所示用於轉換編碼之視窗仍然具有一最大重疊,以在當前訊框中接受理想重建,且毋需使用正向混疊消除。此最大重疊較佳地被設定成10ms,可用的超前時間,即10ms,從第2a圖中可以清楚地看出。
雖然第2a圖已相關於一編碼器而被描述,其中用於轉換編碼的視窗204是一分析視窗,應指出的是,視窗204也代表用於轉換解碼的一合成視窗。在一較佳實施例中,分析視窗等同於合成視窗,且此二視窗本身是對稱的。這意味著此二視窗相對於一(水平)中心線是對稱的。然而,在其他應用中,非對稱視窗可被使用,其中分析視窗與合成視窗在形狀上是不同的。
第2b圖繪示一過去訊框之一部分、一後續當前訊框、一接隨當前訊框之後的未來訊框及接續該未來訊框之後的下一未來訊框的一視窗序列。
清楚的是,250所示之藉由一重疊相加處理器所處理的重疊相加部分自每一訊框之起點延伸至每一訊框之中間,即20到30ms之間用以計算未來訊框資料,且40到50ms之間用以計算下一未來訊框的TCX資料,或0到10ms之間用以計算關於當前訊框的資料。然而,對於計算每一訊框之下半部中的資料無重疊相加,且因此,正向混疊消除技術不是必需的。這是因為合成視窗在每一訊框之下半部中具有一非重疊部分。
典型地,一MDCT視窗之長度是一訊框長度的2倍。本發明中也是這樣。然而,當第2a圖被再度考慮時,變得清楚的是,分析/合成視窗僅從零延伸到30ms,但是視窗的完整長度是40ms。此完整長度對提供輸入資料用於MDCT計算之對應的折疊或展開操作是重要的。為了將視窗延伸到14ms的完整長度,5ms的零值被添加到-5到0ms之間,且5秒的MDCT零值也被添加到30到35ms之間的訊框之末端。然而,就延遲考量而言,僅具有零的此添加部分並不起任何作用,這是因為對編碼器或解碼器已知的是視窗的最後5ms及視窗最早的5ms是零,所以此資料已經存在並無任何延遲。
第2c圖繪示兩個可能的轉變。然而,對於一自TCX至ACELP的轉變,無需特別照管,這是因為當相對第2a圖假定未來訊框是一ACELP訊框時,則藉由TCX解碼超前部分206之最後訊框所獲得之資料可單單被刪除,這是因為ACELP訊框恰在未來訊框之起點開始,且因此,不存在資料孔。ACELP資料是自相一致的,且因此,一解碼器,當自TCX切換成ACELP時使用由TCX對於當前訊框所算出的資料,摒除對於未來訊框的由TCX處理所獲得的資料,且代之以使用來自ACELP分支的未來訊框資料。
然而,當一自ACELP至TCX之轉變被執行時,一如第2c圖中所示的特定轉變視窗被使用。此視窗由從0到1的訊框之起點開始,具有一非重疊部分220且末端具有222所指示的一重疊部分,該重疊部分與一直接MDCT視窗之重疊部分206完全一樣。
此外,此視窗在在視窗之起點於-12.5ms到0之間且在視窗之末端於30到35.5ms之間,即超前部分222之後補零。這導致一增加的轉換長度。長度為50ms,但是直接分析/合成視窗之長度僅為40ms。然而,這並未降低效率或增加位元率,且此一較長的轉換在自ACELP切換成TCX時是必要的。對應的解碼器中所使用的轉變視窗與第2c圖中所示之視窗完全一樣。
接著,解碼器被更加詳細地討論。第1b圖繪示用以解碼一編碼音訊信號的一音訊解碼器。音訊解碼器包含一預測參數解碼器180,其中該預測參數解碼器被配置成用以執行來自在181被接收並被輸入至一介面182之編碼音訊信號的一預測編碼訊框之資料的解碼。解碼器另外包含一轉換參數解碼器183,用以執行來自線181上之編碼音訊信號的一轉換編碼訊框之資料的解碼。該轉換參數解碼器被配置成較佳地用以執行一混疊影響的頻譜-時間轉換,且用以對轉換資料應用一合成視窗以獲得當前訊框及一未來訊框的資料。合成視窗具有第一重疊部分、一相鄰的第二非重疊部分,及一相鄰的第三重疊部分,如第2a圖中所示者,其中第三重疊部分僅與未來訊框的音訊樣本相關聯,且非重疊部分僅與當前訊框之資料相關聯。此外,一重疊相加器184被提供用以將與用於當前訊框的一合成視窗之第三重疊部分相關聯之合成視窗樣本和與用於未來訊框的一合成視窗之第一重疊部分相關聯之樣本的一合成視窗重疊及相加,以獲得未來訊框的第一部分的音訊樣本。其餘用於未來訊框的音訊樣本是與未來訊框的合成視窗之第二非重疊部分相關聯的合成視窗化樣本,在當前訊框及未來訊框包含轉換編碼資料時該合成視窗化樣本是在無重疊相加下所獲得的。然而,當自一訊框切換成下一訊框時,一組合器185是有幫助的,它用來照管自一編碼模式到另一編碼模式的良好轉換,以最終在組合器185之輸出處獲得解碼音訊資料。
第1c圖繪示關於轉換參數解碼器183之結構的更多細節。
該解碼器包含一解碼器處理級183a,其被配置成用以執行解碼編碼頻譜信號所必需的所有處理,諸如算術解碼或霍夫曼解碼或一般而言,熵解碼及一後續的解量子化,雜訊填充等,以在區塊183之輸出獲得解碼頻譜值。這些頻譜值被輸入到一頻譜加權器183b中。頻譜加權器183b自一LPC加權資料計算器183c接收頻譜加權資料,LPC加權資料計算器183c是由預測分析區塊在編碼器端所產生,且經由輸入介面182在解碼器接收的LPC資料饋給。接著,一反頻譜轉換被執行,其包含,較佳地一DCT-IV反轉換183d為第一級與一後續的去除折疊,及在用於未來訊框的資料例如被提供給重疊相加器184之前的合成視窗化處理183e。當用於下一未來訊框的資料可用時,該重疊相加器可執行重疊相加操作。區塊183d及183e一起構成頻譜/時間轉換,或在第1c圖中之實施例中,一較佳的MDCT反轉換(MDCT-1)。
特別是,區塊183d接收一20ms訊框的資料,且在區塊183e之去除折疊步驟中增加資料體積成40ms的資料,即之前資料量的兩倍,且隨後,具有40ms長度(當視窗起點及結束之零部分加在一起時)的合成視窗被應用於這些40ms的資料。接著,在區塊183e之輸出處,用於當前區塊的資料及用於未來區塊的超前部分內之資料是可用的。
第1d圖繪示對應的編碼器端處理。就第1d圖所討論之特徵在編碼處理器104中被實施或藉由第3a圖中的對應區塊而被實施。第3a圖中的時間-頻率轉換310較佳地被實施為一MDCT且包含一視窗化、折疊級310a,其中區塊310a中的視窗化操作藉由TCX視窗程式103d來實施。因此,第3a圖中的區塊310中的實際第一操作是折疊操作,以使40ms的輸入資料恢復成20ms的訊框資料。接著,利用具有已接收混疊貢獻的折疊資料執行一DCT-IV,如區塊310d中所示者。區塊302(LPC分析)向一(LPC至MDCT)區塊302b提供使用結束訊框LPC視窗由分析所導出之LPC資料,且區塊302d藉由頻譜加權器312產生用以執行頻譜加權的加權因數。較佳地是,TCX編碼模式中的一20ms訊框的16個LPC係數較佳地藉由使用一oDFT(奇數離散傅立葉轉換)被轉換成16個MDCT-域加權因數。對於其他模式,諸如具有8kHz取樣率的NB模式,LPC係數的數目可以較少,諸如10。對於具有一較高取樣率的其他模式,也可能有16個以上的LPC係數。此oDFT之結果是16個加權值,且每一加權值與由區塊310b所獲得之頻譜資料之頻帶相關聯。頻譜加權藉由將一頻帶的所有MDCT頻譜值除以與頻帶相關聯的同一加權值而進行,非常高效率地在區塊312中執行此頻譜加權操作。因此,16個頻帶的MDCT值各除以對應的加權因數以輸出頻譜加權頻譜值,該等頻譜加權頻譜值接著如業內所知地進一步由區塊314進一步處理,即例如藉由量子化及熵編碼進一步處理。
另一方面,在解碼器端,對應於第1d圖中之區塊312的頻譜加權將是由第1c圖中所示之頻譜加權器183b執行的一乘法運算。
隨後,第4a圖及第4b圖被討論,以概述第2圖中所示由LPC分析視窗產生或由兩個LPC分析視窗所產生之LPC資料如何在ACELP模式或在TCX/MDCT模式中使用。
繼應用LPC分析視窗之後,自相關計算利用LPC視窗化資料來執行。接著,一列文遜-杜賓演算法應用在自相關函數上。接著,用於每一LP分析的16個LP係數,即用於中訊框視窗的16個係數及用於結束訊框視窗的16個係數,被轉換成ISP值。因此,從自相關計算到ISP轉換的步驟,例如在第4a圖之方塊400中執行。接著,計算在編碼器端藉由ISP係數之量子化繼續。接著,ISP係數再次被反量子化並轉換回到LP係數域。因此,LPC資料或,換句話說,16個與方塊400中所導出的LPC係數稍有不同(由於量子化及再量子化)的LPC係數被獲得,它們可接著直接用於第四子訊框,如步驟401中所指示者。然而,對於其他子訊框,較佳地是執行若干內插,例如,Rec.ITU-T G.718(06/2008)之6.8.3節中所概述者。用於第三子訊框的LPC資料藉由內插結束訊框及中訊框LPC資料而被算出,如方塊402所示者。較佳的內插是每一對應的資料被除以2並加在一起,即結束訊框與中訊框LPC資料的一平均。為了計算第二子訊框的LPC資料,如方塊403中所示者,一內插額外被執行。特別是,最後訊框的結束訊框LPC資料值之10%,當前訊框的中訊框LPC資料之80%及當前訊框之結束訊框的LPC資料值之10%被使用,以最終計算第二子訊框的LPC資料。
最終,藉由形成最後訊框之結束訊框LPC資料與當前訊框之中訊框LPC資料的一平均值,第一子訊框的LPC資料被算出,如方塊404中所指示者。
為了執行ACELP編碼,量子化LPC參數集,即來自中訊框分析及結束訊框分析者,被發送至一解碼器。
基於藉由方塊401至404所算出的個別子訊框之結果,ACELP計算被執行,如方塊405中所指示,以獲得欲被發送至解碼器的ACELP資料。
隨後,第4b圖被描述。在方塊400中,中訊框及結束訊框LPC資料再次被算出。然而,由於有TCX編碼模式,僅結束訊框LPC資料被發送至解碼器且中訊框LPC資料並未被發送至解碼器。特別是,並未將LPC係數本身發送至解碼器,而是發送ISP轉換及量子化之後所獲得的值。因此,較佳地是,如同LPC資料一般,由結束訊框LPC資料係數所導出之量子化ISP值被發送至解碼器。
然而,在編碼器中,步驟406至408中的程序仍然被執行,以獲得用以加權當前訊框之MDCT頻譜資料的加權因數。為此,當前訊框之結束訊框LPC資料及過去訊框之結束訊框LPC資料被內插。然而,較佳地是,並不內插由LPC分析直接導出的LPC資料係數本身。而是較佳地是內插由對應的LPC係數所導出的量子化且再次反量子化的ISP值。因此,方塊406中所用的LPC資料以及方塊401至404中之其他計算所用的LPC資料始終是最好是由每一LPC分析視窗的原始的16個LPC係數所導出的量子化且再次反量子化之ISP資料。
方塊406中的內插較佳地是一純平均化,即對應的值被相加並除以2。接著,在方塊407中,當前訊框之MDCT頻譜資料使用內插LPC資料而被加權,且在方塊408中,加權頻譜資料之進一步處理被執行,以最終獲得欲自編碼器發送至一解碼器的編碼頻譜資料。因此,步驟407中所執行的程序對應於區塊312,且第4d圖中的方塊408中所執行的程序對應於第4d圖中的區塊314。對應的操作實際上在解碼器端執行。因此,在解碼器端需要相同的內插以便一方面計算頻譜加權因數、或另一方面藉由內插計算個別子訊框的LPC係數。因此,第4a圖和第4b圖對方塊401至404或第4b圖之406中的程序而言同等地適用於解碼器端。
本發明對低延遲編解碼器實施態樣尤其有用。這意指此類編解碼器被設計成算法或系統延遲較佳地在45ms以下,且在某些情況下甚至等於或低於35ms。然而,LPC分析及TCX分析的超前部分對獲得一良好的音訊品質是必要的。因此,在二矛盾要求間良好折衷是必要的。已發現,一方面延遲與另一方面品質間的良好折衷可藉由具有20ms訊框長度的一切換音訊編碼器或解碼器來獲得,但是也發現,15到30ms之間的訊框長度值也提供可接受的結果。另一方面,已發現,當就延遲問題而論時,一10ms的超前部分是可接受的,但是,視對應的應用而定,5ms到20ms之間的值也是有用的。此外,已發現,當值為0.5時,超前部分與訊框長度之間的關係是有用的,但是0.4到0.6之間的其他值也是有用的。此外,儘管本發明已一方面就ACELP且另一方面就MDCT-TCX而被描述,在時域中操作的其他演算法,諸如CELP或任何其他預測或波形算法也是有用的。至於TCX/MDCT,其他轉換域編碼演算法,諸如MDST,或任何其他基於轉換的演算法也可被應用。
對LPC分析及LPC計算之特定實施態樣也是如此。較佳地是依賴於之前所述之程序,但計算/內插及分析的其他程序也可被使用,只要那些程序依賴於一LPC分析視窗。
儘管有些層面已就一裝置而被描述,但是應清楚的是,這些層面也代表對應方法之說明,其中一方塊或裝置對應於一方法步驟或一方法步驟之一特徵。類似地,就一方法步驟而描述的層面也代表一對應裝置之對應方塊或項目或特徵的說明。
視某些實施要求而定,本發明實施例可以硬體或以軟體來實施。該實施可使用一數位儲存媒體來執行,例如其上儲存有電子可讀取控制信號的軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體,該等電子可讀取控制信號與一可程式電腦系統協作(或能夠與之協作),使得各別方法得以執行。
依據本發明的某些實施例包含具有電子可讀取控制信號的一非暫時性資料載體,該等電子可讀取控制信號能夠與一可程式電腦系統協作,使得本文所述方法中的一者得以執行。
一般而言,本發明實施例可被實施為具有一程式碼的一電腦程式產品,當該電腦程式產品在一電腦上運行時,該程式碼可作用以執行該等方法中的一者。該程式碼例如可儲存在一機器可讀取載體上。
其他實施例包含儲存在一機器可讀取載體上,用以執行本文所述方法中的一者的電腦程式。
因此,換言之,本發明方法的一實施例是具有一程式碼的一電腦程式,當該電腦程式在一電腦上運行時,該程式碼用以執行本文所述方法中的一者。
因此,本發明方法的另一實施例是一資料載體(或一數位儲存媒體,或一電腦可讀取媒體),包含記錄在其上之用以執行本文所述方法中之一者的電腦程式。
因此,本發明方法的又一實施例是代表用以執行本文所述方法中之一者的電腦程式的一資料流或一序列信號。該資料流或序列信號例如可以被配置成經由一資料通訊連接,例如經由網際網路來傳送。
另一實施例包含一處理裝置,例如電腦,或一可程式邏輯裝置,其被配置成或適應於執行本文所述方法中的一者。
另一實施例包含其上安裝有用以執行本文所述方法中之一者的電腦程式的一電腦。
在某些實施例中,一可程式邏輯裝置(例如現場可程式閘陣列)可用以執行本文所述方法的某些或全部功能。在某些實施例中,一現場可程式閘陣列可與一微處理器協作以執行本文所述方法中之一者。一般而言,該等方法較佳地由任一硬體裝置來執行。
上述實施例僅說明本發明的原理。應理解的是,本文所述配置的修改及變化及細節對熟於此技者將是顯而易見的。因此,意圖僅受後附專利申請範圍之範圍的限制而並不受經由說明及解釋本文實施例而提出的特定細節的限制。
100‧‧‧音訊資料
102‧‧‧視窗程式/區塊
102a‧‧‧LPC視窗程式
102b‧‧‧轉換編碼視窗程式/TCX視窗程式
103d‧‧‧TCX視窗程式
104‧‧‧編碼處理器
104a、104b‧‧‧區塊/編碼分支/分支/裝置
105‧‧‧線
106‧‧‧輸出介面
107‧‧‧輸出編碼信號
108a‧‧‧LPC資料
108b‧‧‧線
110a、110b‧‧‧視窗化資料
112‧‧‧編碼模式選擇器或控制器/決策器
112a、112b、112c‧‧‧比較器
112c‧‧‧比較器/最終比較器
114a、114b‧‧‧控制線
180‧‧‧預測參數解碼器
181‧‧‧線
182‧‧‧介面/輸入介面
183‧‧‧轉換參數解碼器/區塊
183a‧‧‧解碼器處理級
183b‧‧‧頻譜加權器
183c‧‧‧LPC加權資料計算器
183d‧‧‧DCT-IV反轉換/區塊
183e‧‧‧去除折疊且合成視窗化處理/區塊
184‧‧‧重疊相加器
185‧‧‧組合器
200‧‧‧視窗/LPC分析視窗
202‧‧‧中訊框LPC分析視窗/LPC分析視窗
204‧‧‧MDCT視窗/視窗
206‧‧‧超前部分/重疊部分/第二重疊部分
208‧‧‧超前部分/非重疊部分
210‧‧‧第一重疊部分/重疊部分/訊框
220‧‧‧非重疊部分
222‧‧‧超前部分
250‧‧‧重疊相加部分
300‧‧‧箭頭
302‧‧‧LPC分析器及內插器/區塊
302b‧‧‧區塊/(LPC至MDCT)區塊
302d‧‧‧區塊
304‧‧‧感知加權濾波器或加權區塊/感知加權區塊
306‧‧‧預測編碼參數計算器
310‧‧‧時間-頻率轉換區塊/區塊/時間-頻率轉換
310a‧‧‧視窗化、折疊級/區塊
310b‧‧‧區塊
312‧‧‧頻譜加權區塊/頻譜加權/頻譜加權器/區塊
314‧‧‧處理/量子化編碼區塊/區塊
400‧‧‧方塊
401‧‧‧步驟/方塊
402、403、404、405‧‧‧方塊
406~408‧‧‧步驟/方塊
500‧‧‧LPC分析視窗
502‧‧‧當前訊框
504‧‧‧超前部分
506‧‧‧LPC分析視窗
508、514‧‧‧超前部分
510、512‧‧‧LPC分析視窗/視窗
516、520‧‧‧LPC分析視窗
516‧‧‧LPC分析視窗/USAC分析視窗
518‧‧‧LPC分析視窗超前部分
522‧‧‧TCX視窗
第1a圖繪示一切換音訊編碼器的一方塊圖;第1b圖繪示一對應的切換解碼器的一方塊圖;第1c圖繪示關於第1b圖中所示之轉換參數解碼器的更多細節;第1d圖繪示關於第1a圖之解碼器之轉換編碼模式的更多細節;第2a圖繪示應用在轉換編碼分析之編碼器中之視窗程式的一較佳實施例,該視窗程式一方面供LPC分析用,且另一方面是第1b圖之轉換編碼解碼器中所使用的合成視窗的一表示;第2b圖繪示對於二訊框以上之時距的對齊LPC分析視窗及TCX視窗的一視窗序列;第2c圖繪示自TCX轉變成ACELP的一情況及自ACELP轉變成TCX的一轉變視窗;第3a圖繪示第1a圖之編碼器之更多細節;第3b圖繪示用以決定一訊框的一編碼模式的一合成分析程序;第3c圖繪示用以決定每一訊框之模式的另一實施例;第4a圖繪示藉由利用兩個不同的LPC分析視窗所導出的LPC資料對一當前訊框的計算及使用;第4b圖繪示藉由對編碼器之TCX分支使用一LPC分析視窗而視窗化所獲得之LPC資料之使用;第5a圖繪示用於AMR-WB的LPC分析視窗;第5b圖繪示為了LPC分析用於AMR-WB+的對稱視窗;第5c圖繪示一G.718編碼器的LPC分析視窗;第5d圖繪示USAC中所使用的LPC分析視窗;以及第6圖繪示相對於一當前訊框之一TCX視窗的當前訊框之一LPC分析視窗。
100‧‧‧音訊資料
102‧‧‧視窗程式/區塊
104‧‧‧編碼處理器
106‧‧‧輸出介面
107‧‧‧輸出編碼信號
108a‧‧‧LPC資料
108b‧‧‧線
110a、110b‧‧‧視窗化資料
112‧‧‧編碼模式選擇器或控制器
114a、114b‧‧‧控制線
权利要求:
Claims (25)
[1] 一種用以編碼具有一音訊樣本流的一音訊信號的裝置,其包含:一視窗程式,其用以對該音訊樣本流應用一預測編碼分析視窗以獲得供預測分析用之視窗化資料,且用以對該音訊樣本流應用一轉換編碼分析視窗以獲得供轉換分析用之視窗化資料,其中該轉換編碼分析視窗與一當前音訊樣本訊框內之音訊樣本以及作為一轉換編碼超前部分的一未來音訊樣本訊框之一預定義部分之音訊樣本相關聯,其中該預測編碼分析視窗與該當前訊框之音訊樣本的至少一部分以及作為一預測編碼超前部分的未來訊框之一預定義部分之音訊樣本相關聯,其中該轉換編碼超前部分及該預測編碼超前部分彼此是完全相同的或不同之處在於20%的預測編碼超前部分或小於20%的轉換編碼超前部分;及一編碼處理器,其用以使用供預測分析用之視窗化資料來產生當前訊框之預測編碼資料、或用以使用供轉換分析用之視窗化資料來產生當前訊框之轉換編碼資料。
[2] 如申請專利範圍第1項所述之裝置,其中該轉換編碼分析視窗包含在該轉換編碼超前部分中延伸的一非重疊部分。
[3] 如申請專利範圍第1或2項所述之裝置,其中該轉換編碼分析視窗包含從該當前訊框之起點開始且在該非重疊部分之起點結束的另一重疊部分。
[4] 如申請專利範圍第1項所述之裝置,其中該視窗程式被配置成僅使用一起始視窗用於自一訊框到下一訊框由預測編碼到轉換編碼的轉變,其中該開始視窗並未用於自一訊框到下一訊框由轉換編碼到預測編碼的轉變。
[5] 如先前申請專利範圍中的任一項所述之裝置,其進一步包含:一輸出介面,用以輸出該當前訊框的一編碼信號;及一編碼模式選擇器,用以控制該編碼處理器以輸出該當前訊框的預測編碼資料或轉換編碼資料,其中該編碼模式選擇器被配置成僅在整個訊框的預測編碼或轉換編碼之間切換,使得整個訊框的編碼信號包含預測編碼資料或轉換編碼資料。
[6] 如先前申請專利範圍中的任一項所述之裝置,其中該視窗程式除使用該預測編碼分析視窗以外還使用與被設置於該當前訊框之起點的音訊樣本相關聯的另一預測編碼分析視窗,且其中該預測編碼分析視窗未與被設置於該當前訊框之起點的音訊樣本相關聯。
[7] 如先前申請專利範圍中的任一項所述之裝置,其中該訊框包含複數子訊框,其中該預測分析視窗以一子訊框之一中心為中心,且其中該轉換編碼分析視窗以二子訊框之間的一邊界為中心。
[8] 如申請專利範圍第7項所述之裝置,其中該預測分析視窗以該訊框之最後子訊框之中心為中心,其中該另一分析視窗以該當前訊框之第二子訊框之一中心為中心,且其中該轉換編碼分析視窗以該當前訊框之第三與第四子訊框之間的一邊界為中心,其中該當前訊框被細分為四個子訊框。
[9] 如先前申請專利範圍中的任一項所述之裝置,其中另一預測編碼分析視窗之未來訊框中並沒有超前部分且與該當前訊框之樣本相關聯。
[10] 如先前申請專利範圍中的任一項所述之裝置,其中該轉換編碼分析視窗另外包含在該視窗之一起點之前的一零部分及該視窗之一末端之後的一零部分,使得該轉換編碼分析視窗的一完整時間長度是該當前訊框之時間長度的兩倍。
[11] 如申請專利範圍第10項所述之裝置,其中,對於自一訊框到下一訊框從該預測編碼模式到該轉換編碼模式的一轉變,一轉變視窗被該視窗程式加以利用,其中該轉變視窗包含從該訊框之起點開始的第一非重疊部分及從該非重疊部分之末端開始並延伸到該未來訊框中的一重疊部分,其中延伸到該未來訊框中的該重疊部分之長度等於該分析視窗之轉換編碼超前部分之長度。
[12] 如先前申請專利範圍中的任一項所述之裝置,其中該轉換編碼分析視窗的一時間長度大於該預測編碼分析視窗的一時間長度。
[13] 如先前申請專利範圍中的任一項所述之裝置,其進一步包含:一輸出介面,用以輸出該當前訊框的一編碼信號;及一編碼模式選擇器,用以控制該編碼處理器以輸出該當前訊框的預測編碼資料或轉換編碼資料,其中該視窗被配置成使用位於該當前訊框中預測編碼視窗之前的另一預測編碼視窗,且其中該編碼模式選擇器被配置成控制該編碼處理器以於該轉換編碼資料被輸出至該輸出介面時僅轉發由該預測編碼視窗所導出的預測編碼分析資料,且不轉發由該另一預測編碼視窗所導出的預測編碼分析資料,以及其中該編碼模式選擇器被配置成控制該編碼處理器以轉發由該預測編碼視窗所導出的預測編碼分析資料,並當該預測編碼資料被輸出至該輸出介面時轉發由該另一預測編碼視窗所導出的預測編碼分析資料。
[14] 如先前申請專利範圍中的任一項所述之裝置,其中該編碼處理器包含:一預測編碼分析器,用以由供一預測分析用之視窗化資料導出該當前訊框的預測編碼資料;一預測編碼分支,其包含:一濾波器級,用以使用該預測編碼資料,由該當前訊框的音訊樣本來計算濾波器資料;及一預測編碼器參數計算器,用以計算該等當前訊框的預測編碼參數;及一轉換編碼分支,其包含:一時間-頻譜轉換器,用以將用於轉換編碼演算法的視窗資料轉換成一頻譜表示;一頻譜加權器,用以使用由該預測編碼資料所導出的加權之加權資料來加權頻譜資料以獲得加權頻譜資料;及一頻譜資料處理器,用以處理該加權頻譜資料以獲得該當前訊框的轉換編碼資料。
[15] 一種編碼具有一音訊樣本流的一音訊信號的方法,其包含以下步驟:對該音訊樣本流應用一預測編碼分析視窗以獲得供預測分析用之視窗化資料,且對該音訊樣本流應用一轉換編碼分析視窗以獲得供轉換分析用之視窗化資料,其中該轉換編碼分析視窗與一當前音訊樣本訊框內的音訊樣本以及作為一轉換編碼超前部分的一未來音訊樣本訊框之一預定義部分之音訊樣本相關聯,其中該預測編碼分析視窗與該當前訊框之音訊樣本之至少一部分且與作為一預測編碼超前部分的該未來訊框之一預定義部分之音訊樣本相關聯,其中該轉換編碼超前部分及該預測編碼超前部分彼此是完全相同的或不同之處在於小於20%的預測編碼超前部分或小於20%的轉換編碼超前部分;及使用供預測分析用之視窗化資料來產生該當前訊框的預測編碼資料或使用供轉換分析用之視窗化資料來產生該當前訊框的轉換編碼資料。
[16] 一種用以解碼一編碼音訊信號的音訊解碼器,其包含:一預測參數解碼器,用以執行來自該編碼音訊信號的一預測編碼訊框的資料之解碼;一轉換參數解碼器,用以執行來自該編碼音訊信號的一轉換編碼訊框的資料之解碼,其中該轉換參數解碼器被配置成用以執行一頻譜-時間轉換且用以對轉換資料應用一合成視窗以獲得該當前訊框及一未來訊框的資料,該合成視窗具有第一重疊部分、一相鄰的第二重疊部分及一相鄰的第三重疊部分,該第三重疊部分與用於該未來訊框的音訊樣本相關聯且該非重疊部分與該當前訊框之資料相關聯;及一重疊相加器,用以將與用於當前訊框的一合成視窗之第三重疊部分相關聯之合成視窗化樣本及與用於未來訊框的一合成視窗之第一重疊部分相關聯之合成視窗化樣本重疊並相加,以獲得用於未來訊框的第一部分的音訊樣本,其中當該當前訊框及未來訊框包含轉換編碼資料時,該未來訊框的其餘音訊樣本是與在未重疊相加下所獲得的該未來訊框的合成視窗之第二非重疊部分相關聯之合成視窗化樣本。
[17] 如申請專利範圍第16項所述之音訊解碼器,其中該編碼音訊信號之當前訊框包含轉換編碼資料,且該未來訊框包含預測編碼資料,其中該轉換參數解碼器被配置成使用該當前訊框的合成視窗來執行一合成視窗化,以獲得與該合成視窗之非重疊部分相關聯的視窗化音訊樣本,其中與該當前訊框的合成視窗之第三重疊部分相關聯之合成視窗化音訊樣本被摒除,且其中該未來訊框的音訊樣本由該預測參數解碼器來提供,沒有來自該轉換參數解碼器的資料。
[18] 如申請專利範圍第16或17項所述之音訊解碼器,其中該當前訊框包含預測編碼資料且該未來訊框包含轉換編碼資料,其中該轉換參數解碼器被配置成使用不同於該合成視窗的一轉變視窗,其中該轉變視窗包含一在該未來訊框之起點的第一非重疊部分及一開始於該未來訊框之一末端並延伸到時間上在該未來訊框之後的訊框中的重疊部分,且其中該未來訊框的音訊樣本在無重疊下產生,且與該未來訊框之視窗之第二重疊部分相關聯之音訊資料藉由該重疊相加器使用該未來訊框之後的訊框之合成視窗之第一重疊部分來計算。
[19] 如申請專利範圍第16至18項中任一項所述之音訊解碼器,其中該轉換參數計算器包含:一頻譜加權器,用以使用預測編碼資料來加權該當前訊框的解碼轉換頻譜資料;及一預測編碼加權資料計算器,用以藉由組合由一過去訊框所導出之預測編碼資料與由該當前訊框所導出之預測編碼資料的一加權總和來計算該預測編碼資料,以獲得內插預測編碼資料。
[20] 如申請專利範圍第19項所述之音訊解碼器,其中該預測編碼加權資料計算器被配置成將該預測編碼資料轉換成具有每一頻帶的一加權值的一頻譜表示,且其中該頻譜加權器被配置成藉由此頻帶的同一加權值加權一頻帶中的所有頻譜值。
[21] 如申請專利範圍第16至19項中任一項所述之音訊解碼器,其中該合成視窗被配置成具有小於50ms且大於25ms的一總時間長度,其中該第一及該第三重疊部分具有相同的長度且其中該第三重疊部分具有小於15ms的一長度。
[22] 如申請專利範圍第16至21項中任一項所述之音訊解碼器,其中該合成視窗具有無零填充部分的一30ms的長度,該第一及第三重疊部分各具有一10ms長度且該非重疊部分具有一10ms長度。
[23] 如申請專利範圍第16至22項中任一項所述之音訊解碼器,其中該轉換參數解碼器被配置成對於頻譜-時間轉換應用一具有對應於一訊框長度的樣本數目的DCT轉換,及用以產生一兩倍於DCT之前的時間值數目的時間值數目的去除折疊操作,及對該去除折疊操作之一結果應用該合成視窗,其中該合成視窗包含,在該第一重疊部分之前及在該第三重疊部分之後,具有該第一及第三重疊部分之一半長度的一長度的零部分。
[24] 一種解碼一編碼音訊信號的方法,其包含以下步驟:對來自該編碼音訊信號之一預測編碼訊框的資料執行解碼;由該編碼音訊信號,其中執行一轉換編碼訊框之資料之解碼的步驟包含執行一頻譜-時間轉換及對轉換資料應用一合成視窗以獲得該當前訊框及一未來訊框的資料,該合成視窗具有第一重疊部分,一相鄰的第二重疊部分及一相鄰的第三重疊部分,該第三重疊部分與該未來訊框的音訊樣本相關聯且該非重疊部分與該當前訊框之資料相關聯;及將與該當前訊框的一合成視窗之第三重疊部分相關聯之合成視窗化樣本及與該未來訊框的一合成視窗之第一重疊部分相關聯之合成視窗化樣本重疊並相加,以獲得該未來訊框的第一部分的音訊樣本,其中當該當前訊框及該未來訊框包含轉換編碼資料時,該未來訊框的其餘音訊樣本是與在未重疊相加下所獲得的未來訊框的合成視窗之第二非重疊部分相關聯之合成視窗化樣本。
[25] 一種具有一程式碼的電腦程式,當在一電腦上運行時,執行如申請專利範圍第15項所述之編碼一音訊信號的方法或如申請專利範圍第24項所述之解碼一音訊信號的方法。
类似技术:
公开号 | 公开日 | 专利标题
TWI479478B|2015-04-01|用以使用對齊的預看部分將音訊信號解碼的裝置與方法
KR101325335B1|2013-11-08|오디오 샘플 인코드 및 디코드용 오디오 인코더 및 디코더
JP6067601B2|2017-01-25|音声/音楽統合信号の符号化/復号化装置
KR20110043592A|2011-04-27|샘플링된 오디오 신호의 프레임들을 인코딩 및 디코딩하기 위한 오디오 인코더 및 디코더
US9620129B2|2017-04-11|Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
AU2012217269A1|2013-09-05|Apparatus and method for processing a decoded audio signal in a spectral domain
RU2574849C2|2016-02-10|Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра
AU2013200679B2|2015-03-05|Audio encoder and decoder for encoding and decoding audio samples
同族专利:
公开号 | 公开日
RU2013141919A|2015-03-27|
ZA201306839B|2014-05-28|
TW201506907A|2015-02-16|
AU2012217153B2|2015-07-16|
JP6110314B2|2017-04-05|
EP3503098A1|2019-06-26|
KR101698905B1|2017-01-23|
US20130332148A1|2013-12-12|
TWI479478B|2015-04-01|
SG192721A1|2013-09-30|
AU2012217153A1|2013-10-10|
CN103503062B|2016-08-10|
BR112013020699A2|2016-10-25|
CN105304090A|2016-02-03|
AR102602A2|2017-03-15|
ES2725305T3|2019-09-23|
KR101853352B1|2018-06-14|
MX2013009306A|2013-09-26|
EP2676265B1|2019-04-10|
MY160265A|2017-02-28|
BR112013020699B1|2021-08-17|
CN103503062A|2014-01-08|
TR201908598T4|2019-07-22|
KR20130133846A|2013-12-09|
AR085221A1|2013-09-18|
EP2676265A1|2013-12-25|
PT2676265T|2019-07-10|
CA2827272A1|2012-08-23|
KR20160039297A|2016-04-08|
CA2827272C|2016-09-06|
PL2676265T3|2019-09-30|
JP2014510305A|2014-04-24|
TWI563498B|2016-12-21|
CN105304090B|2019-04-09|
AR098557A2|2016-06-01|
US9047859B2|2015-06-02|
WO2012110473A1|2012-08-23|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
EP1126437B1|1991-06-11|2004-08-04|QUALCOMM Incorporated|Apparatus and method for masking errors in frames of data|
US5408580A|1992-09-21|1995-04-18|Aware, Inc.|Audio compression system employing multi-rate signal analysis|
BE1007617A3|1993-10-11|1995-08-22|Philips Electronics Nv|Transmissiesysteem met gebruik van verschillende codeerprincipes.|
US5784532A|1994-02-16|1998-07-21|Qualcomm Incorporated|Application specific integrated circuit for performing rapid speech compression in a mobile telephone system|
KR100419545B1|1994-10-06|2004-06-04|코닌클리케 필립스 일렉트로닉스 엔.브이.|다른코딩원리들을이용한전송시스템|
EP0720316B1|1994-12-30|1999-12-08|Daewoo Electronics Co., Ltd|Adaptive digital audio encoding apparatus and a bit allocation method thereof|
SE506379C3|1995-03-22|1998-01-19|Ericsson Telefon Ab L M|Lpc-talkodare med kombinerad excitation|
US5848391A|1996-07-11|1998-12-08|Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.|Method subband of coding and decoding audio signals using variable length windows|
JP3259759B2|1996-07-22|2002-02-25|日本電気株式会社|音声信号伝送方法及び音声符号復号化システム|
JPH10124092A|1996-10-23|1998-05-15|Sony Corp|音声符号化方法及び装置、並びに可聴信号符号化方法及び装置|
US5960389A|1996-11-15|1999-09-28|Nokia Mobile Phones Limited|Methods for generating comfort noise during discontinuous transmission|
JPH10214100A|1997-01-31|1998-08-11|Sony Corp|音声合成方法|
US6134518A|1997-03-04|2000-10-17|International Business Machines Corporation|Digital audio signal coding using a CELP coder and a transform coder|
JPH10276095A|1997-03-28|1998-10-13|Toshiba Corp|符号化器及び復号化器|
JP3223966B2|1997-07-25|2001-10-29|日本電気株式会社|音声符号化/復号化装置|
US6070137A|1998-01-07|2000-05-30|Ericsson Inc.|Integrated frequency-domain voice coding using an adaptive spectral enhancement filter|
EP0932141B1|1998-01-22|2005-08-24|Deutsche Telekom AG|Method for signal controlled switching between different audio coding schemes|
GB9811019D0|1998-05-21|1998-07-22|Univ Surrey|Speech coders|
US7272556B1|1998-09-23|2007-09-18|Lucent Technologies Inc.|Scalable and embedded codec for speech and audio signals|
US6317117B1|1998-09-23|2001-11-13|Eugene Goff|User interface for the control of an audio spectrum filter processor|
US7124079B1|1998-11-23|2006-10-17|Telefonaktiebolaget Lm Ericsson |Speech coding with comfort noise variability feature for increased fidelity|
FI114833B|1999-01-08|2004-12-31|Nokia Corp|Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi|
JP2003501925A|1999-06-07|2003-01-14|エリクソンインコーポレイテッド|パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置|
JP4464484B2|1999-06-15|2010-05-19|パナソニック株式会社|雑音信号符号化装置および音声信号符号化装置|
US6236960B1|1999-08-06|2001-05-22|Motorola, Inc.|Factorial packing method and apparatus for information coding|
CN101512633B|2006-07-24|2012-01-25|索尼株式会社|毛发运动合成器系统和用于毛发/皮毛流水线的优化技术|
EP1259957B1|2000-02-29|2006-09-27|QUALCOMM Incorporated|Closed-loop multimode mixed-domain speech coder|
US6757654B1|2000-05-11|2004-06-29|Telefonaktiebolaget Lm Ericsson|Forward error correction in speech coding|
JP2002118517A|2000-07-31|2002-04-19|Sony Corp|直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法|
US6847929B2|2000-10-12|2005-01-25|Texas Instruments Incorporated|Algebraic codebook system and method|
CA2327041A1|2000-11-22|2002-05-22|Voiceage Corporation|A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals|
US20040142496A1|2001-04-23|2004-07-22|Nicholson Jeremy Kirk|Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease|
US20020184009A1|2001-05-31|2002-12-05|Heikkinen Ari P.|Method and apparatus for improved voicing determination in speech signals containing high levels of jitter|
US20030120484A1|2001-06-12|2003-06-26|David Wong|Method and system for generating colored comfort noise in the absence of silence insertion description packets|
US6941263B2|2001-06-29|2005-09-06|Microsoft Corporation|Frequency domain postfiltering for quality enhancement of coded speech|
US6879955B2|2001-06-29|2005-04-12|Microsoft Corporation|Signal modification based on continuous time warping for low bit rate CELP coding|
KR100438175B1|2001-10-23|2004-07-01|엘지전자 주식회사|코드북 검색방법|
CA2388439A1|2002-05-31|2003-11-30|Voiceage Corporation|A method and device for efficient frame erasure concealment in linear predictive based speech codecs|
CA2469674C|2002-09-19|2012-04-24|Matsushita Electric Industrial Co., Ltd.|Audio decoding apparatus and method|
US7343283B2|2002-10-23|2008-03-11|Motorola, Inc.|Method and apparatus for coding a noise-suppressed audio signal|
US7363218B2|2002-10-25|2008-04-22|Dilithium Networks Pty. Ltd.|Method and apparatus for fast CELP parameter mapping|
KR100465316B1|2002-11-18|2005-01-13|한국전자통신연구원|음성 부호화기 및 이를 이용한 음성 부호화 방법|
JP4191503B2|2003-02-13|2008-12-03|日本電信電話株式会社|音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム|
US7318035B2|2003-05-08|2008-01-08|Dolby Laboratories Licensing Corporation|Audio coding systems and methods using spectral component coupling and spectral component regeneration|
US20050091044A1|2003-10-23|2005-04-28|Nokia Corporation|Method and system for pitch contour quantization in audio coding|
PL1683133T3|2003-10-30|2007-07-31|Koninl Philips Electronics Nv|Kodowanie lub dekodowanie sygnału audio|
CA2457988A1|2004-02-18|2005-08-18|Voiceage Corporation|Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization|
US20070147518A1|2005-02-18|2007-06-28|Bruno Bessette|Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX|
FI118835B|2004-02-23|2008-03-31|Nokia Corp|Koodausmallin valinta|
WO2005096274A1|2004-04-01|2005-10-13|Beijing Media Works Co., Ltd|Dispositif et procede de codage/decodage audio ameliores|
GB0408856D0|2004-04-21|2004-05-26|Nokia Corp|Signal encoding|
MXPA06012617A|2004-05-17|2006-12-15|Nokia Corp|Codificacion de audio con diferentes longitudes de cuadro de codificacion.|
US7649988B2|2004-06-15|2010-01-19|Acoustic Technologies, Inc.|Comfort noise generator using modified Doblinger noise estimate|
TWI253057B|2004-12-27|2006-04-11|Quanta Comp Inc|Search system and method thereof for searching code-vector of speech signal in speech encoder|
US7519535B2|2005-01-31|2009-04-14|Qualcomm Incorporated|Frame erasure concealment in voice communications|
RU2405217C2|2005-01-31|2010-11-27|Скайп Лимитед|Способ взвешенного сложения с перекрытием|
US8155965B2|2005-03-11|2012-04-10|Qualcomm Incorporated|Time warping frames inside the vocoder by modifying the residual|
US8364494B2|2005-04-01|2013-01-29|Qualcomm Incorporated|Systems, methods, and apparatus for split-band filtering and encoding of a wideband signal|
WO2006126844A2|2005-05-26|2006-11-30|Lg Electronics Inc.|Method and apparatus for decoding an audio signal|
US7707034B2|2005-05-31|2010-04-27|Microsoft Corporation|Audio codec post-filter|
CN101213591B|2005-06-18|2013-07-24|诺基亚公司|用于非连续语音传输期间的舒适噪声参数自适应传输的系统和方法|
KR100851970B1|2005-07-15|2008-08-12|삼성전자주식회사|오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치|
US7610197B2|2005-08-31|2009-10-27|Motorola, Inc.|Method and apparatus for comfort noise generation in speech communication systems|
US7720677B2|2005-11-03|2010-05-18|Coding Technologies Ab|Time warped modified transform coding of audio signals|
US7536299B2|2005-12-19|2009-05-19|Dolby Laboratories Licensing Corporation|Correlating and decorrelating transforms for multiple description coding systems|
US8255207B2|2005-12-28|2012-08-28|Voiceage Corporation|Method and device for efficient frame erasure concealment in speech codecs|
CN101371295B|2006-01-18|2011-12-21|Lg电子株式会社|用于编码和解码信号的设备和方法|
AU2007206167B8|2006-01-18|2010-06-24|Industry-Academic Cooperation Foundation, Yonsei University|Apparatus and method for encoding and decoding signal|
US8032369B2|2006-01-20|2011-10-04|Qualcomm Incorporated|Arbitrary average data rates for variable rate coders|
US8160274B2|2006-02-07|2012-04-17|Bongiovi Acoustics Llc.|System and method for digital signal processing|
FR2897733A1|2006-02-20|2007-08-24|France Telecom|Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant|
US20070253577A1|2006-05-01|2007-11-01|Himax Technologies Limited|Equalizer bank with interference reduction|
US7873511B2|2006-06-30|2011-01-18|Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.|Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic|
JP4810335B2|2006-07-06|2011-11-09|株式会社東芝|広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置|
US7933770B2|2006-07-14|2011-04-26|Siemens Audiologische Technik Gmbh|Method and device for coding audio data based on vector quantisation|
US7987089B2|2006-07-31|2011-07-26|Qualcomm Incorporated|Systems and methods for modifying a zero pad region of a windowed frame of an audio signal|
DE102006049154B4|2006-10-18|2009-07-09|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Kodierung eines Informationssignals|
KR101016224B1|2006-12-12|2011-02-25|프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우|인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법|
FR2911227A1|2007-01-05|2008-07-11|France Telecom|Codage par transformee, utilisant des fenetres de ponderation et a faible retard|
KR101379263B1|2007-01-12|2014-03-28|삼성전자주식회사|대역폭 확장 복호화 방법 및 장치|
FR2911426A1|2007-01-15|2008-07-18|France Telecom|Modification d'un signal de parole|
JP4708446B2|2007-03-02|2011-06-22|パナソニック株式会社|符号化装置、復号装置およびそれらの方法|
JP2008261904A|2007-04-10|2008-10-30|Matsushita Electric Ind Co Ltd|符号化装置、復号化装置、符号化方法および復号化方法|
US8630863B2|2007-04-24|2014-01-14|Samsung Electronics Co., Ltd.|Method and apparatus for encoding and decoding audio/speech signal|
US9653088B2|2007-06-13|2017-05-16|Qualcomm Incorporated|Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding|
KR101513028B1|2007-07-02|2015-04-17|엘지전자 주식회사|방송 수신기 및 방송신호 처리방법|
US8185381B2|2007-07-19|2012-05-22|Qualcomm Incorporated|Unified filter bank for performing signal conversions|
CN101110214B|2007-08-10|2011-08-17|北京理工大学|一种基于多描述格型矢量量化技术的语音编码方法|
ES2748843T3|2007-08-27|2020-03-18|Ericsson Telefon Ab L M|Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable|
US8566106B2|2007-09-11|2013-10-22|Voiceage Corporation|Method and device for fast algebraic codebook search in speech and audio coding|
CN101388210B|2007-09-15|2012-03-07|华为技术有限公司|编解码方法及编解码器|
US8576096B2|2007-10-11|2013-11-05|Motorola Mobility Llc|Apparatus and method for low complexity combinatorial coding of signals|
CN101425292B|2007-11-02|2013-01-02|华为技术有限公司|一种音频信号的解码方法及装置|
DE102007055830A1|2007-12-17|2009-06-18|Zf Friedrichshafen Ag|Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges|
CN101483043A|2008-01-07|2009-07-15|中兴通讯股份有限公司|基于分类和排列组合的码本索引编码方法|
CN101488344B|2008-01-16|2011-09-21|华为技术有限公司|一种量化噪声泄漏控制方法及装置|
US8000487B2|2008-03-06|2011-08-16|Starkey Laboratories, Inc.|Frequency translation by high-frequency spectral envelope warping in hearing assistance devices|
EP2107556A1|2008-04-04|2009-10-07|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Audio transform coding using pitch correction|
US8879643B2|2008-04-15|2014-11-04|Qualcomm Incorporated|Data substitution scheme for oversampled data|
US8768690B2|2008-06-20|2014-07-01|Qualcomm Incorporated|Coding scheme selection for low-bit-rate applications|
AU2009267433B2|2008-07-11|2013-06-13|Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.|Providing a time warp activation signal and encoding an audio signal therewith|
MY154452A|2008-07-11|2015-06-15|Fraunhofer Ges Forschung|An apparatus and a method for decoding an encoded audio signal|
CA2871252C|2008-07-11|2015-11-03|Nikolaus Rettelbach|Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program|
KR101403115B1|2008-10-08|2014-06-27|보이세지 코포레이션|다중 분해능 스위치드 오디오 부호화/복호화 방법 및 부호화/복호화기|
ES2401487T3|2008-07-11|2013-04-22|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena|
CA2871498C|2008-07-11|2017-10-17|Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.|Audio encoder and decoder for encoding and decoding audio samples|
PL2311034T3|2008-07-11|2016-04-29|Fraunhofer Ges Forschung|Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio|
EP2144171B1|2008-07-11|2018-05-16|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Audio encoder and decoder for encoding and decoding frames of a sampled audio signal|
US8352279B2|2008-09-06|2013-01-08|Huawei Technologies Co., Ltd.|Efficient temporal envelope coding approach by prediction between low band signal and high band signal|
WO2010031049A1|2008-09-15|2010-03-18|GH Innovation, Inc.|Improving celp post-processing for music signals|
US8798776B2|2008-09-30|2014-08-05|Dolby International Ab|Transcoding of audio metadata|
CN101770775B|2008-12-31|2011-06-22|华为技术有限公司|信号处理方法及装置|
US8457975B2|2009-01-28|2013-06-04|Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.|Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program|
ES2567129T3|2009-01-28|2016-04-20|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de ordenador|
EP2214165A3|2009-01-30|2010-09-15|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Apparatus, method and computer program for manipulating an audio signal comprising a transient event|
JP5520967B2|2009-02-16|2014-06-11|エレクトロニクスアンドテレコミュニケーションズリサーチインスチチュート|適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置|
EP2234103B1|2009-03-26|2011-09-28|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Device and method for manipulating an audio signal|
PL3352168T3|2009-06-23|2021-03-08|Voiceage Corporation|Postępowe tłumienie aliasingu w dziedzinie czasu z zastosowaniem w ważonej albo pierwotnej dziedzinie sygnału|
CN101958119B|2009-07-16|2012-02-29|中兴通讯股份有限公司|一种改进的离散余弦变换域音频丢帧补偿器和补偿方法|
EP2491555B1|2009-10-20|2014-03-05|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Multi-mode audio codec|
PL2473995T3|2009-10-20|2015-06-30|Fraunhofer Ges Forschung|Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem|
CN102081927B|2009-11-27|2012-07-18|中兴通讯股份有限公司|一种可分层音频编码、解码方法及系统|
US8428936B2|2010-03-05|2013-04-23|Motorola Mobility Llc|Decoder for audio signal including generic audio and speech frames|
US8423355B2|2010-03-05|2013-04-16|Motorola Mobility Llc|Encoder for audio signal including generic audio and speech frames|
TW201214415A|2010-05-28|2012-04-01|Fraunhofer Ges Forschung|Low-delay unified speech and audio codec|US9972325B2|2012-02-17|2018-05-15|Huawei Technologies Co., Ltd.|System and method for mixed codebook excitation for speech coding|
DK2823479T3|2012-09-11|2015-10-12|Ericsson Telefon Ab L M|GENERATION OF COMFORT CLOTHING|
US9129600B2|2012-09-26|2015-09-08|Google Technology Holdings LLC|Method and apparatus for encoding an audio signal|
FR3011408A1|2013-09-30|2015-04-03|Orange|Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard|
WO2016016053A1|2014-07-28|2016-02-04|Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.|Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction|
FR3024581A1|2014-07-29|2016-02-05|Orange|Determination d'un budget de codage d'une trame de transition lpd/fd|
KR20170011905A|2015-07-24|2017-02-02|삼성전자주식회사|음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치|
KR102192678B1|2015-10-16|2020-12-17|삼성전자주식회사|음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치|
MX2018008889A|2016-01-22|2018-11-09|Fraunhofer Ges Zur Foerderung Der Angewandten Forscng E V|Aparato y metodo para estimar una diferencia de tiempos entre canales.|
法律状态:
优先权:
申请号 | 申请日 | 专利标题
US201161442632P| true| 2011-02-14|2011-02-14||
PCT/EP2012/052450|WO2012110473A1|2011-02-14|2012-02-14|Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion|
[返回顶部]